# A tibble: 5 × 2
date_onset hospital
<date> <chr>
1 2014-05-18 Port Hospital
2 2014-05-21 Military Hospital
3 2014-05-22 Port Hospital
4 2014-06-06 Port Hospital
5 2014-06-13 Military Hospital
Aula 12, M2
Sala de Situação - UnB
Funções join(), pivot_longer/wider.
Vocês! aula 13.1 Edição com set_header_labels(), add_header_row(), set_caption() e font(). Entregar o .Rmd da tabela da aula com algumas modificações simples.
Pacotes stringr e lubridate
# A tibble: 5 × 2
date_onset hospital
<date> <chr>
1 2014-05-18 Port Hospital
2 2014-05-21 Military Hospital
3 2014-05-22 Port Hospital
4 2014-06-06 Port Hospital
5 2014-06-13 Military Hospital
# A tibble: 5 × 3
Hospital N_residentes level
<fct> <dbl> <chr>
1 central hospital 1950280 Tertiary
2 military hospital 40500 Secondary
3 military hospital 10000 Primary
4 port hospital 50280 Secondary
5 central hospital 12000 Secondary
Preciso de pelo menos de uma coluna “chave” para união.
Preciso Garantir
mesmo nome de coluna (é melhor)
mesma classe de coluna
nomes da chave que correspondam com exatidão
# A tibble: 5 × 2
date_onset hospital
<date> <chr>
1 2014-05-18 Port Hospital
2 2014-05-21 Military Hospital
3 2014-05-22 Port Hospital
4 2014-06-06 Port Hospital
5 2014-06-13 Military Hospital
# A tibble: 5 × 3
Hospital N_residentes level
<fct> <dbl> <chr>
1 central hospital 1950280 Tertiary
2 military hospital 40500 Secondary
3 military hospital 10000 Primary
4 port hospital 50280 Secondary
5 central hospital 12000 Secondary
rename()
Dá para encadear com o pipe %>%
names()
deve ter aspas e também todos os nomes
# A tibble: 5 × 2
Inicio_sint Hospital
<date> <chr>
1 2014-05-18 Port Hospital
2 2014-05-21 Military Hospital
3 2014-05-22 Port Hospital
4 2014-06-06 Port Hospital
5 2014-06-13 Military Hospital
# A tibble: 5 × 3
Hospital N_residentes level
<fct> <dbl> <chr>
1 central hospital 1950280 Tertiary
2 military hospital 40500 Secondary
3 military hospital 10000 Primary
4 port hospital 50280 Secondary
5 central hospital 12000 Secondary
As colunas “chave” devem ser do mesmo tipo.
Vemos que nesse caso, uma é fator e a outra um caractere.
# A tibble: 5 × 2
Inicio_sint Hospital
<date> <chr>
1 2014-05-18 Port Hospital
2 2014-05-21 Military Hospital
3 2014-05-22 Port Hospital
4 2014-06-06 Port Hospital
5 2014-06-13 Military Hospital
# A tibble: 5 × 3
Hospital N_residentes level
<chr> <dbl> <chr>
1 central hospital 1950280 Tertiary
2 military hospital 40500 Secondary
3 military hospital 10000 Primary
4 port hospital 50280 Secondary
5 central hospital 12000 Secondary
Os nomes não estão escritos da mesma forma
Funções úteis
# A tibble: 5 × 2
Inicio_sint Hospital
<date> <chr>
1 2014-05-18 port hospital
2 2014-05-21 military hospital
3 2014-05-22 port hospital
4 2014-06-06 port hospital
5 2014-06-13 military hospital
# A tibble: 5 × 3
Hospital N_residentes level
<chr> <dbl> <chr>
1 central hospital 1950280 Tertiary
2 military hospital 40500 Secondary
3 military hospital 10000 Primary
4 port hospital 50280 Secondary
5 central hospital 12000 Secondary
Podemos seguir com o join!
# A tibble: 4 × 4
Inicio_sint Hospital N_residentes level
<date> <chr> <dbl> <chr>
1 2014-05-18 port hospital 50280 Secondary
2 2014-05-21 military hospital 40500 Secondary
3 2014-05-21 military hospital 10000 Primary
4 2014-05-22 port hospital 50280 Secondary
left_join()
right_join()
inner_join()
full_join()
semi_join()
anti_join()
E tem mais coisa na nova versão do dplyr!
“Tidy datasets are all alike, but every messy dataset is messy in its own way.” —- Hadley Wickham
“Base de dados arrumadas são todas iguais, mas bases desorganizadas, são desorganizadas em sua própria maneira”
É bom pra tabelas, mas não é bom pra para o ggplot…
É bom para o ggplot, mas não para apresentar em tabela!
Vamos supor que eu queria colorir segundo a faixa-etária.
location_name data_date faixa_0_04 faixa_5_14 faixa_15_mais Total
1 Facility 1 2020-08-11 11 12 23 46
2 Facility 1 2020-08-10 11 4 5 20
3 Facility 1 2020-08-09 18 4 84 106
4 Facility 1 2020-08-04 16 7 20 43
5 Facility 1 2020-08-03 12 9 15 36
6 Facility 1 2020-08-02 14 13 12 39
# A tibble: 6 × 5
location_name data_date Total name value
<chr> <date> <int> <chr> <int>
1 Facility 1 2020-08-11 46 faixa_0_04 11
2 Facility 1 2020-08-11 46 faixa_5_14 12
3 Facility 1 2020-08-11 46 faixa_15_mais 23
4 Facility 1 2020-08-10 20 faixa_0_04 11
5 Facility 1 2020-08-10 20 faixa_5_14 4
6 Facility 1 2020-08-10 20 faixa_15_mais 5
Outra base
Faixa-etária x Sexo